3d动漫精品啪啪一区二区免费,柠檬福利精品视频导航,亚洲成a人无码亚洲成www牛牛,99精品国产高清一区二区

聯(lián)
咨詢熱線:

185-9527-1032

聯(lián)系QQ:

2863379292

官方微信:

搜索引擎對關(guān)鍵字堆砌的識別

全網(wǎng)營銷

導(dǎo)讀:搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對矛盾,合理的優(yōu)化有助于搜索引擎對網(wǎng)站內(nèi)容的識別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以

發(fā)表日期:2019-12-08

文章編輯:興田科技

瀏覽次數(shù):9255

標(biāo)簽:

搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對矛盾,合理的優(yōu)化有助于搜索引擎對網(wǎng)站內(nèi)容的識別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以期達(dá)到增加頁面收錄數(shù)和頁面排名的目的。

早期的關(guān)鍵字堆砌SpAM作弊方式之一,是將中文詞庫中的單詞直接用軟件拼湊成文章,這樣的文章沒有實(shí)際的意義,只能給搜索引擎看。那么對于這樣的文章,搜索引擎是通過什么方式來識別的呢?

我們知道,每個(gè)搜索引擎都有網(wǎng)頁質(zhì)量監(jiān)控部門,對于百度等摻雜人工處理的搜索引擎而言,用戶發(fā)現(xiàn)這樣的網(wǎng)站,投訴到百度,百度直接封了這個(gè)網(wǎng)站了事。但對于Google這樣的封站也是自動處理的搜索引擎而言,對關(guān)鍵字堆砌作弊的識別就顯得更為重要了。

對于關(guān)鍵字堆砌作弊方式的識別,搜索引擎一般采用統(tǒng)計(jì)分析的方法進(jìn)行。

搜索引擎首先將網(wǎng)頁進(jìn)行分詞,分詞完成后可以得到詞的數(shù)量N和文章長度L,從大量文章的統(tǒng)計(jì)中發(fā)現(xiàn)文章的長度L和詞的數(shù)量N兩個(gè)數(shù)字之間存在一定的分布關(guān)系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說一篇長度為1000字節(jié)的文章中,應(yīng)該有125-250個(gè)分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個(gè)比值的范圍會有所不同。如果搜索引擎發(fā)現(xiàn)L/N特別大,那么這篇文章就存在就存在關(guān)鍵字堆砌現(xiàn)象了,如果L/N特別小,則可能是這篇文章是由一些詞所組成的沒有意義的文章,筆者對泥胚文章中的不同作者發(fā)表的文章進(jìn)行了驗(yàn)證,基本上都服從這個(gè)比值范圍。

進(jìn)一步,通過大量正常文章統(tǒng)計(jì)發(fā)現(xiàn),文章中密度最高的幾個(gè)關(guān)鍵字出現(xiàn)的次數(shù)之和與N/L存在一定的分布關(guān)系,搜索引擎就可以通過網(wǎng)頁中的分布與統(tǒng)計(jì)結(jié)果的分布圖進(jìn)行比較得出文章是否存在關(guān)鍵字堆砌的現(xiàn)象。

此外,搜索引擎還將從停止字的比例來判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,如果文章中停止字的比例在正常的比例范圍之外,這個(gè)網(wǎng)頁應(yīng)提交到網(wǎng)頁質(zhì)量監(jiān)控部門審核。

當(dāng)然,還有更多的算法可以對網(wǎng)頁與自然語言的文章進(jìn)行比較分析,以判別文章是否為自然文章。

所謂魔高一尺、道高一丈,有些作弊者已經(jīng)放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過爬蟲或其它方式獲得網(wǎng)上文章的句子,并用軟件將數(shù)十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語義的分析來判斷是否作弊了,然而目前關(guān)于語義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。

然而我們?nèi)匀徊荒軐⒆詣游恼律梢还髯哟蛩溃谌斯ぶ悄艿奈恼律扇匀皇侨祟愌芯孔陨碚Z言以及自身智能的一個(gè)重要方向。作弊與反作弊,將能促使人類對人工智能的研究。

如果到最后,軟件能生成人類能夠理解的文章,這是SpAM還是精華?你能肯定地說目前存在的智能化程度還不夠高的RSS聚合文章一定是SpAM嗎?然而,如果這樣的文章海量的出現(xiàn),我們又該如何去面對這個(gè)現(xiàn)象?

參考文獻(xiàn):《搜索引擎原理、實(shí)踐和應(yīng)用》盧亮、張博文,2007

相關(guān)推薦

更多新聞

  • 12-8

    2019

    全網(wǎng)營銷 / 2019-12-08

    搜索引擎對關(guān)鍵字堆砌的識別

    搜索引擎和搜索引擎優(yōu)化(SEO)一直是一對矛盾,合理的優(yōu)化有助于搜索引擎對網(wǎng)站內(nèi)容的識別,有助于網(wǎng)站的推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以

    View details

  • 11-13

    2020

    全網(wǎng)營銷 / 2020-11-13

    【干貨分享】官網(wǎng)優(yōu)化SEO排名怎么做?

      關(guān)于官網(wǎng)優(yōu)化,其實(shí)吧想要做好網(wǎng)站外部鏈接。然而SEO說簡單也簡單,說復(fù)雜也復(fù)雜。團(tuán)隊(duì)運(yùn)用的是否為正規(guī)的技術(shù)? 我個(gè)人曾經(jīng)用過一些非正規(guī)技術(shù),但是經(jīng)過一

    View details

  • 11-13

    2020

    全網(wǎng)營銷 / 2020-11-13

    不得不知的關(guān)于搜索引擎優(yōu)化首頁標(biāo)題!

      關(guān)于搜索引擎優(yōu)化,對于網(wǎng)站建設(shè)的首頁可以說它就相當(dāng)于人的臉面,因?yàn)槲覀兛匆粋€(gè)人的時(shí)候,首先看到的是對方的臉,相對的搜索引擎優(yōu)先的參考對象就是標(biāo)題了

    View details

  • 11-13

    2020

    全網(wǎng)營銷 / 2020-11-13

    果斷收藏:網(wǎng)站建設(shè)中的關(guān)鍵詞排名的后期工作!

      關(guān)于關(guān)鍵詞排名,對于網(wǎng)站建設(shè)前期的一個(gè)規(guī)劃關(guān)系著一個(gè)網(wǎng)站建設(shè)得是否成功,網(wǎng)站建設(shè)前需明確建設(shè)網(wǎng)站的目的,確定網(wǎng)站的功能和規(guī)模,進(jìn)行必要的市場分析,只

    View details

国产精品日本一区二区不卡视频| 久久99精品久久久久久久久久| 成年女人喷潮毛片免费播放| 蜜芽国产尤物av尤物在线看| 日日摸日日碰夜夜爽歪歪| 亚洲暴爽AV人人爽日日碰| 国产在线观看高清视频黄网| 日本在线视频www色| 久久亚洲精品无码观看不卡| 国产亚洲人成在线播放| 精品久久久久久综合日本| 国产乱人伦AV在线A更新| 久久精品人妻中文系列葵司| 中文字幕亚洲一区二区三区| 亚洲中文字幕无码超碰| 久久久亚洲AV波多野结衣| 推油少妇久久99久久99久久| 免费午夜福利在线观看视频| 一本色道久久综合亚洲精品| 人妻暴雨中被强制侵犯在线| 亚洲 欧美 小说| 精品无码久久久久久久动漫| 无码AV专区丝袜专区| 欧洲精品成人免费视频在线观看| 国自产拍亚洲免费视频| 两个奶头被吃高潮视频| 国产精品无码一区二区在线| 大香伊人久久精品一区二区| 精品亚洲AV无码国产一区在线| 久久久久亚洲AV无码专区喷水| 一个人免费视频WWW在线观看| 久久精品国产亚洲av大全| 久久无码人妻精品一区二区三区| 欧洲精品成人免费视频在线观看| 久久综合久中文字幕青草| 国产不卡视频一区二区三区| 成 人 免费 黄 色 网站视频| 青草青草视频2免费观看| 国产一区二区三区不卡在线观看| 欧洲日韩亚洲无线在码| 久久丫精品久久丫|